خلاصه سازی چند سندی مبتنی بر استخراج مفاهیم

پایان نامه
چکیده

با گسترش روز افزون حجم داده ها و اطلاعات، خلاصه سازی خودکار متون نیز با استقبال چشم گیر محققین روبرو شده است. در سال های اخیر خلاصه سازی چندسندی با اقبال بیشتری مواجه بوده است. یک سیستم خلاصه سازی چندسندی استخراجی، خلاصه سازی است که چندین سند را به عنوان ورودی دریافت کرده و گزبده ای از جملات اسناد اولیه را تولید می نماید. . خلاصه خوب باید بیانگر زمینه کلی بوده و ضمن بیان دیدگاه های مختلف موجود در متن از خوانایی و پیوستگی بالایی برخوردار باشد. در این پایان نامه با تمرکز به مشکلات اصلی خلاصه سازی چندسندی، یعنی پوشش کامل مطالب اصلی و عدم وجود افزونگی، روشی جدید برای خلاصه سازی ارائه شده است. در مدل پیشنهادی در ابتدا با دید کلی بر اسناد، زمینه آنها استخراج می شود. سپس جملات بر اساس شباهت با زمینه مرتب می شوند. در ادامه با استفاده از برچسب زنی معنایی جملات و شبکه واژگان، شباهت کلمات در نقش های معنایی یکسان محاسبه شده و افزونگی حذف می شود. برای استخراج زمینه از روش آنالیز روابط معنایی پنهان استفاده شده است. نحوه استفاده از این روش در این پایان نامه، باعث افزایش قابل توجه دقت نسبت به کاربردهای قبلی این تکنیک در روش های پیشین شده است. همچنین روش پیشنهادی برای حذف جملات تکراری نسبت به روش های گذشته، منجر به حذف با دقت بیشتر شده است. ارزیابی سیستم پیشنهادی برروی داده های کنفرانس duc و با استفاده از معیار ارزیابی rouge صورت گرفته است. همچنین سیستم پیشنهادی برروی پیکره کوچکی از متون فارسی هم ارزیابی شده است.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

یک الگوریتم مبتنی بر گراف برای خلاصه سازی متون

سیستم های خلاصه برداری از متن، یافتن اطلاعات مورد نیاز را از میان خیل عظیم اطلاعاتی که در قالب متن هستند، تسریع می کنند. این سیستم ها از روش های مختلفی برای انتخاب مهم ترین موضوعات متن استفاده می کنند. یکی از روش هایی که در این زمینه به صورت گسترده مورد استفاده قرار می گیرد، استفاده از ساختار گراف و ویژگی های آن برای انتخاب مهم ترین جملات متن است. الگوریتم ارائه شده در این تحقیق، سعی در خلاصه س...

خلاصه سازی خودکار متون فارسی مبتنی بر هستی شناسی

با توجه به گسترش روزافزون اطلاعات در دسترس از طریق اینترنت، لزوم استفاده از روش های خلاصه سازی خودکار متن، بیش از پیش احساس می شود. روش هایی که با استخراج مهمترین مطالب موجود در اسناد مانع از مطالعه کامل حجم انبوه از آنها شوند. خلاصه سازی عبارت است از فشرده سازی متن (متون) منبع و تولید یک نسخه کوتاه تر از آن به نحوی که محتوای اطلاعاتی آن حفظ شود. اغلب سیستم های خلاصه ساز با استفاده از روش های س...

15 صفحه اول

خلاصه سازی چکیده ای مبتنی بر مشابهت جملات

خلاصه سازی خودکار متون همزمان با رشد روز افزون اسناد و طلاعات بیش از پیش مورد توجه علاقه مندان حوزه پردازش زبان طبیعی قرار گرفته است. از این میان خلاصه سازی چند سنده که در آن چندین سند به عنوان ورودی دریافت می گردد، مورد توجه زیادی قرار گرفته است. در بسیاری از روش های تنها گزیده ای از جملات اولیه بدون تغییر به عنوان خلاصه برگردانده می شود. که به خلاصه سازی گزینشی معروف است. در مقابل آن در زمینه...

15 صفحه اول

خلاصه سازی اخبار با یک روش ترکیبی خوشه بندی - ژنتیکی

با گسترش روز افزودن داده های متنی ، بدست آوردن اطلاعات مورد نظر مسئله اساسی در عصر اینترنت است. برای تطبیق با این مسئله فناوریهای جدید که قادر به پردازش داده های حجیم بصورت موثر هستند مورد نیاز است. خلاصه سازهای خودکار یکی از ابزارهای مهم در این راستاست که در حوزه های گوناگون مثل اسناد پزشکی ، مقالات علمی و آرشیو اخبار مورد استفاده قرار می گیرد. این پایان نامه به خلاصه سازی چند سندی در زبان انگ...

15 صفحه اول

تبیین مفهوم خلاصه همگان‌فهم و استخراج شاخص‌های نگارش آن

  ترویج علم به دنبال راه‌هایی است تا عامه مردم نیز بتوانند از یافته‌های علمی بهره‌مند شوند. نگارش خلاصه همگان‌فهم از نمونۀ این راه‌هاست که باید به زبانی ساده، بدون واژگان تخصصی، و با تشریح اصطلاح‌های فنی نوشته شود. در این مقاله مفهوم خلاصۀ همگان‌فهم، شباهت‌ها و تفاوت‌های آن با مفاهیم همانند، زمینه‌های موضوعی و اشکال بکارگیری آن در نوشته‌های علمی، و شاخص‌های تدوین آن تبیین شده‌اند. با روش...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023